Step 2 软硬件平台
4. 软硬件平台
- 硬件需求:英伟达 NVIDIA 的显卡。
- 操作系统需求:windows 10/11 系统。
- 软件需求:CUDA,msmpi, paraview。
4.1 前置软件需求
- msmpi:msmpi 是微软公司提供的 CPU 并行工具,推荐安装版本 10.1.3,下载网址:https://www.microsoft.com/en-us/download/details.aspx?id=105289 。
- CUDA:CUDA 是英伟达公司提供的 GPU 并行工具,推荐安装版本 12.0 以上版本,12.0 版本下载网址:https://developer.nvidia.com/cuda-12-0-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exe_local 。
- paraview:paraview 为一款免费的开源可视化软件,推荐安装版本 5.11.1,下载网址:https://www.paraview.org/download/ 。
4.2 各求解器显存需求
经测试,各求解器的百万显存占用略低于 2GB,各模式下百万网格显存消耗如下表所示:
流体求解器 | CFD-DEM 耦合模块 | 高内存模式 | 低内存模式 | 极低内存模式 |
---|---|---|---|---|
单相流 | 全解析耦合(球形) | ~1.7 GB | ~1.5 GB | ~1.3 GB |
两相流 | 全解析耦合(球形) | ~1.9 GB | ~1.7 GB | ~1.5 GB |
单相流 | 全解析耦合(球形) | ~1.8 GB | ~1.6 GB | ~1.4 GB |
两相流 | 全解析耦合(球形) | ~2.0 GB | ~1.8 GB | ~1.6 GB |
单相流 | 全解析耦合(非球形) | ~1.8 GB | ~1.6 GB | ~1.4 GB |
两相流 | 全解析耦合(非球形) | ~2.0GB | ~1.8 GB | ~1.6 GB |
注:低内存模式约是高内存模式计算速度的 80%,极低内存模式约是高内存模式计算速度的 45%。请慎重选择!
单张 4090 显卡(考虑 23 GB 可用显存)可支持的最大网格数:
流体求解器 | CFD-DEM 耦合模块 | 高内存模式 | 中内存模式 | 低内存模式 |
---|---|---|---|---|
单相流 | 全解析耦合(球形) | ~1350 万 | ~1530 万 | ~1760 万 |
两相流 | 全解析耦合(球形) | ~1210 万 | ~1350 万 | ~1530 万 |
单相流 | 全解析耦合(球形) | ~1270 万 | ~1430 万 | ~1640 万 |
两相流 | 全解析耦合(球形) | ~1150 万 | ~1270 万 | ~1430 万 |
单相流 | 全解析耦合(非球形) | ~1270 万 | ~1430 万 | ~1640 万 |
两相流 | 全解析耦合(非球形) | ~1150 万 | ~1270 万 | ~1430 万 |
4.3 常用显卡信息
RTX 系列 | 3060Ti | 4060Ti | 4070Ti | 4070Ti Super | 4090 |
---|---|---|---|---|---|
显存 | 8 GB | 8 GB | 12 GB | 16 GB | 24 GB |
计算效率 | 100% | ~115% | ~190% | ~200% | ~300% |
计算耗时举例 | 24 h | ~21 h | ~12.6 h | ~12 h | ~8 h |